2翠溪生物技术研究院, 诸暨, 311800;
3海南省热带农业资源开发利用研究所, 三亚, 572025;
4广西大学生命科学与技术学院, 南宁, 530005
作者 通讯作者
《分子植物育种》网络版, 2017 年, 第 15 卷, 第 2 篇
收稿日期: 1970年01月01日 接受日期: 1970年01月01日 发表日期: 1970年01月01日
Li Z.F, Zhang J., Wei F., Cai M.D., Liu Z.P., and Fang X.J., 2016, Identification of genes related to photoperiod regulating the circadian clock in legume plants, Molecular Plant Breeding, 15(1): 1- 20(doi: 10.5376/mpb. 2017.15.0001)
为了鉴定豆科植物中光周期调控生物钟的相关基因,本研究采用生物信息学的方法对豆科中的光敏色素、隐花色素、LKP1/FKFI/LKP2、PIF3/PIF4/PIF5、SRR1、CO/COL1/COL2、TIC、XCT和FHY3共9类光周期生物钟调控相关基因进行分析,结果表明,光周期生物钟调控途径在拟南芥和豆科的这3个物种中发生了不同程度的分化。而以拟南芥为参照,百脉根和蒺藜苜蓿的光周期生物钟调控网络相关基因的分化程度要大于大豆,这可能是由于百脉根和蒺藜苜蓿基因组远小于大豆基因组造成的。
生物钟几乎参与植物体所有的新陈代谢、生长发育的调控过程,而且主要是通过控制基因的表达来实现的,比如某些色素它们通过感知外界环境中的光信号来调控体内的生物钟的振荡节律,同时,它们自身的表达也受到内在的生物钟机制的精密调控(李宗飞等, 2015; Covington et al., 2008)。植物各器官的生长和发育都是由植物内在的生物钟控制的,例如,生物钟在调控胚轴生长中的作用被认为主要是控制光信号输入的途径,这种作用类似于控制CAB基因的表达(李宗飞等, 2015)。它可以协调各种生理活动,使得体内的各种生理活动能够在适当的时机进行。因此,对各种植物生物钟调控网络进行研究有着非常重大的意义。
植物生物钟节律性这种内在的生理周期与地球上24小时的光周期相似(Devlin and Kay, 2001)。而光则是外界环境中时间同步机制的一种极其重要的信号。所以研究者们就把鉴定光信号途径中的与生物钟相关的成员作为研究生物钟的一个重要的线索。在拟南芥中,两类主要的光受体,光敏色素(PHY)和隐花色素(CRY)都参与了由光周期控制的生物钟(Somers et al., 1998)。无论是光敏色素还是隐花色素,都可以通过感知外界环境中的光信号来调控体内的生物钟的振荡节律,同时其自身的表达也受到内在的生物钟机制的精密调控。表明在植物体内,存在着一个调控光信号输入和设置生物钟节律的调控环。同时,植物体内还存在着一系列的阀门机制来控制外界光信号输入生物钟系统。
在本研究中,蒺藜苜蓿和百脉根是豆科中的模式植物,而大豆是重要的经济作物,这3个物种已先后完成了全基因组测序,可以为我们的分析提供较为完整的基因组数据。我们通过将得到的光周期调控因子在全基因组水平上与蒺藜苜蓿,百脉根和大豆这三个物种进行比对,进行相应的生物信息学分析。
1结果与分析
1.1光敏色素在豆科中直系同源基因的鉴定
在拟南芥中光敏色素编码的5个蛋白中,PHYB (Canto´n, 1999)主要接受红光,而PHYA(Franklin et al., 2007)和PHYE(Clack et al., 1994)则主要接受远红光。光敏色素以两种状态存在:一种为红光吸收型(Pr),另一种为远红光吸收型(Pfr)。Pfr是生理激活型,不稳定,Pr是生理失活型,比较稳定。Pfr与Pr的状态可在光照下发生转型。PHYA是类型(Johnson et al., 1994),吸收红光转化成有活性的Pfr形式后会经历迅速的蛋白质水解过程;而其他4条基因是类型II,具有高度的光稳定性,光下稳定。
光引起的光敏色素在核一胞质内的运动与植物生理节律有关(Hanano et al., 2006)。有一系列的光敏色素参与了这个过程,研究最为清楚的在细胞核内光敏色素相互作用因子是PIF3(phytochrome interactingfactor3) (McWatters et al., 2000)。PIF3与CCA1和LHY等基因启动子区的G-box结合,进而抑制这些基因的表达;而经红光照射后,PHYB被活化并从细胞质进入细胞核中与PIF3结合,解除PIF3对CCA1和LHY等基因的抑制;并进一步诱导下游的受光诱导的基因表达。
PHYA的结构域主要由4部分构成,中间靠近N端的光敏色素结构域,中间靠近C端是2个PAS结构域,PAS结构域是光周期调控的生物钟的相关因子的共同结构,能够与含G-box顺式作用元件结合,还有C端的HATPase结构域,此外还有GAP和His结构域(图1)。
图 1 PHY蛋白的保守功能结构域分析, 氨基酸序列比对, 分子进化树和进化距离 注: A: PHY蛋白保守结构域分析; B: PHY氨基酸序列比对; C: PHY蛋白的分子进化树; D: 4个物种之间PHY蛋白的进化距离 Figure 1 Conservation domain analysis,protein sequence alignment ,Molecular evolution tree and evlutional distance of PHY proteins Note: A: Conservation domain analysis of PRR protein; B: PHY protein sequences alignment; C: Molecular evolution tree of PHY proteins; D: The distance of PHY protein bewteen four species |
从构建的分子进化树上,我们可以看到,在拟南芥中,PHY可以分为2大类,PHYA,PHYC,PHYE为第一大类,PHYB,PHYD为第一大类。在第一大类中,PHYA和PHYC又聚为一小类(图1)。
PHYA在蒺藜苜蓿中有2个直系同源候选基因,在百脉根中有一个直系同源候选基因,而PHYB和PHYD在这两个物种各有一个直系同源候选基因,但是MtPHYB与PHYB的相似性只有22.3%,并且没有EST表达数据,表明这个基因可能已经退化为假基因。MtPHYA1与MtPHYA2的相似性为100%,而它们都在蒺藜苜蓿1号染色体上,MtPHYA1的起始位置为19823651bp,而MtPHYA2的起始位置为19721115bp,终止位置为19726501,2个基因在1号染色体上相差约100,000bp(表1)。这两个基因可能近期的一个复制进化事件,有可能是1号染色体包括MtPHYA在内部分基因的复制,也可能是MtPHYA单独的基因发生复制转座子插入突变。
表 1 光敏色素基因在豆科3个物种中的直系同源候选基因 Table 1 The forecast Orthologs genes of PHY in three species of Legume |
在大豆中,PHYA有4个直系同源候选基因,而PHYB和PHYE各有2个直系同源候选基因(表1)。
在这3个物种中, PHYA与PHYB的保守性在70%以上,要高于PHYE的保守性,后者为60%左右。
而PHYB,PHYD在豆科中的3个物种均没有找到直系同源基因,表明在拟南芥中,这2个基因实在十字花科和豆科分开后,可能通过基因组复制产生的。
PHY的5个同源基因在十字花科和豆科中的进化历史如下:在十字花科和豆科分离之前,PHY的祖先基因先复制,然后分化为PHYB和PHYE,然后PHYE在通过复制,分为为PHYA和PHYE。在十字花科和豆科分开后,在拟南芥中,PHYB通过复制,分化为PHYB和PHYD,而PHYA通过复制,分化为PHYA和PHYC。而在在蒺藜苜蓿和百脉根中,PHYA,PHYB和PHYE可能在全基因组复制后,又丢失了复制的一份,而保持了这3个基因的单拷贝。而在大豆中,PHYA, PHYB和PHYE都经历了2轮复制,但是PHYB和PHYE在一次复制事件后,又丢失了一份拷贝。GmPHYA1和GmPHYA2是第二次复制事件产生的,2者的进化距离为0.056,而GmPHYB1和GmPHYB2的进化距离为0.063,GmPHYE1和GmPHYE2的进化距离为0.053,表明这2个基因的拷贝是第二次复制事件产生的。
1.2隐花色素在豆科中直系同源基因的鉴定
CRY作为生物钟的光受体,能够接受蓝光,CRY1和CRY2的功能是冗余的,作为蓝光介导生物钟的受体。CRY1和CRY2接受不同强度的蓝光信号,CRY1在蓝光下稳定,主要接受高强度的蓝光,而CRY2在蓝光条件下迅速降解,主要接受低强度的蓝光,蓝光诱导下CRY2的降解可能与ZTL有关。
在拟南芥中隐花色素有CRY1、CRY2和CRY3,其中CRY3与CRY1,CRY2的分歧较远。CRY1和CRY2的功能研究已知,CRY3与前两者之间的相似性较低,在30%以下,并且缺失了DNS关键结构域,表明它和CRY2和CRY1的分化时代较远,可能已经退化为假基因或者演化成了其它的功能(图2)。
图 2 CRY蛋白的保守功能结构域分析, 氨基酸序列比对, 分子进化树和进化距离 注: A: CRY蛋白保守结构域分析; B: CRY氨基酸序列比对; C: CRY蛋白的分子进化树; D: 4个物种之间CRY蛋白的进化距离 Figure 2 Conservation domain analysis,protein sequence alignment ,Molecular evolution tree and evlutional distance of CRY proteins Note: A: Conservation domain analysis of CRY protein; B: CRY protein sequences alignment; C: Molecular evolution tree of CRY proteins; D: The distance of CRY protein bewteen four species |
CRY1,CRY2在蒺藜苜蓿中各鉴定了一个直系同源基因,CRY1在百脉根中鉴定有3个直系同源基因,其中只有1个是全长基因,CRY2在百脉根中鉴定了2个直系同源基因(表2)。CRY1在大豆中鉴定了4个直系同源基因,CRY2在大豆中鉴定了2个直系同源基因。CRY1,CRY2基因在拟南芥和豆科中这3个物种中的保守性较高,表明CRY基因对植物来说是非常重要的。CRY1在拟南芥和豆科3个物种中的保守性要大于CRY2的保守性,前者在75%以上,而后者在60%左右。而CRY3在豆科的3个物种均找不到直系同源基因。
表 2 隐花色素在豆科3个物种中的直系同源候选基因 Table 2 The forecast Orthologs genes of CRY in three species of Legume |
在大豆中,在大豆的4个CRY1基因中,GmCRY1a和GmCRY1b聚为一类,GmCRY1c和GmCRY1d聚为一类,对它们的氨基酸序列的进化距离的分析,发现GmCRY1a和GmCRY1b的进化距离为0.024,GmCRY1c和GmCRY1d的进化距离为0.016,表明GmCRY1c和GmCRY1d面临的选择的压力要大于GmCRY1a和GmCRY1b,因而更加保守,这个也可以从这4个基因与拟南芥中的CRY1基因的进化距离看出来,GmCRY1a,GmCRY1b,GmCRY1c,GmCRY1d与拟南芥的进化距离分别为0.160,0.172,0.148,0.145。从这个意义上来说,GmCRY1c和GmCRY1d更有可能是在大豆种行使调节抑制下胚轴伸长和蓝光引导昼夜节律时钟的功能。而MtCRY1和LjCRY1a与AtCRY1 的进化距离分别为0.133,0.139,这种高度保守性表明它们可能在蒺藜苜蓿和百脉根中行使抑制下胚轴伸长和蓝光引导昼夜节律时钟的功能。
1.3 LKP1/FKFI/LKP2家族在豆科中直系同源候选基因的鉴定
相关的研究表明,ZTL(ZEITLUPE)又名LKP1,FKF1(FLAVIN-BINDING,KELCH REPEAT, F-BOX 1 ),LKP2(LOV, KELCHPROTEIN 2)可能参与了光信号途径控制的生物钟生理途径。F-box结构域出现在作为受体的蛋白质中,并且能够将特定的底物连接到蛋白质泛素连接酶以降解(Craig, 2001)。ZTL蛋白质家族的这些结构域的独特的结合特性表明,他们可能介导某种依赖于光的降解生物钟成分的生理过程,TOC1就是ZTL的底物之一(图3)。
图 3 LKP1/LKP2/FKF1蛋白的保守功能结构域分析, 氨基酸序列比对, 分子进化树和进化距离 注: A: LKP1/LKP2/FKF1蛋白保守结构域分析; B: LKP1/LKP2/FKF1氨基酸序列比对; C: LKP1/LKP2/FKF1蛋白的分子进化树; D: 4个物种之间LKP1/LKP2/FKF1蛋白的进化距离 Figure 3 Conservation domain analysis,protein sequence alignment ,Molecular evolution tree and evlutional distance of LKP1/LKP2/FKF1 proteins Note: A: Conservation domain analysis of LKP1/LKP2/FKF1 protein; B: LKP1/LKP2/FKF1 protein sequences alignment; C: Molecular evolution tree of LKP1/LKP2/FKF1 proteins; D: The distance of LKP1/LKP2/FKF1 protein bewteen four species |
这些基因在光输入途径的作用可能是由它们与光受体的直接相互作用决定的。ZTL在体内被发现与PHYB和CRY1基因有相互作用。ZTL还可以与TOC1和PRR5结合物结合,TOC1和PRR5与ZTL的结合与它们的高度磷酸化状态有关。体内的实验表明,PRR5与ZTL结合体的降解受到蓝光的抑制,TOC1与PRR3在体内相互作用,而它们的磷酸化可以促进它们的结合。另外,ZTL与PRR3都可以与TOC1的N端结合,这就表明,PRR3可能通过磷酸化与TOC1结合从而保护TOC1免受ZTL降解。
LKP2在豆科中的3个物种中没有直系同源基因,所以LKP2可能是在十字花科和豆科分开以后由某种机制导致LKP基因在拟南芥中的复制,功能分化而产生的,拟南芥中,LKP1和LKP2氨基酸序列相似性为72.1%(表3)。
表 3 LKP1/LKP2/FKF1在豆科3个物种中的直系同源候选基因 Table 3 The forecast Orthologs genes of LKP1/LKP2/FKF1in three species of Legume |
LKP1在蒺藜苜蓿和百脉根中各有一个直系同源基因,相似性分别为82.8%和75.5%,而在大豆中有4个直系同源候选基因。除了GmLKP1c的相似性只有68.0%之外,其他三个与拟南芥中LKP1的相似性都在85%左右。PUT序列的数据表明,MtLKP1和GmLKP1a,GmLKP1b,GmLKP1c全长在各自体内都有表达。而LjLKP1却暂时没有找打EST表达的数据,其余LKP1的相似性也偏低,只有75.5%。
FKF1在百脉根中只有一个直系同源基因,在蒺藜苜蓿和大豆中各有2个直系同源基因。FKF1在蒺藜苜蓿和百脉根中的直系同源基因只有部分表达数据,而大豆中的两个直系同源基因则在体内全长表达。
从氨基酸需类比对图中可以看出,GmLKP1c的蛋白质序列在N端保守区域发生2处大的缺失,而MtFKF1a也在C端保守区域发生3处明显的缺失或者突变。
1.4 PIF3/PIF4/PIF5基因在豆科中直系同源候选基因的鉴定
PIF (PHYTOCHROME-INTERACTING FACTOR)家族是一类与光敏色素有相互作用的因子。其中,PIF3/PIF4/PIF5是一类在细胞核内光敏色素的相互作用因子。PIF3和PIF4,PIF5一起作用,在拟南芥中光敏色素一起作用来调节植物应对远红光的反应。PIF3和PIF4,PIF5蛋白质的主要结构域是由碱性氨基酸组成的螺旋一环一螺旋(bHLH)结构中的转录因子。
其中PIF3蛋白质还含有1个PAS(Per-Arn-Sim-like domain)结构域,能与G-box顺式作用元件结合,主要调节下游含有G-Box的MYB类转录物因子,比如LHY/CCA1。相关研究表明,PIF3与LHY/CCA1等基因启动子区的G- box结合以抑制这些基因的表达,而这种抑制作用可以被PHYB所解除。
PIF5编码一个新的bHLH类转录因子,属于类PIF3转录因子家族。与TOC1存在着相互作用,负向调控PHYB的表达,而其蛋白质表达水平又受到PHYB的调控。PIF4的作用与之类似,PIF5还参与了植物的阴影回避生理过程。
PIF4和PIF5还在生物钟调控光周期控制的胚轴伸长的生理途径中起着重要的作用,PIF4和PIF5也可以与光敏色素相互作用。在夜晚,PIF4和PIF5需要短日照条件来刺激其表达量的增加,而长日照条件则不足以促进其表达。所以,光周期控制的胚轴延伸与短日照条件下PIF4与PIF5的积累有关,这是由内在的生物钟机制和外在的光周期机制一致性决定的。
PIF3 在蒺藜苜蓿和百脉根中各有2个直系同源候选基因,在大豆中有4个直系同源候选基因。但是,豆科中PIF3的相似性与拟南芥中的PIF3相似性较低(表4)。但是经过分子进化树的分析,我们发现MtPIF3a,MtPIF3b和LjPIF3b均是PIF3的旁系同源基因,这将会在后面进行分析(图4)。
表 4 PIF3/PIF4/PIF5 在豆科3个物种中的直系同源候选基因 Table 4 The forecast Orthologs genes of PIF3/PIF4/PIF5 in three species of Legume |
图 4 PIF3/PIF4/PIF5 蛋白的保守功能结构域分析, 氨基酸序列比对, 分子进化树和进化距离 注: A: PIF3/PIF4/PIF5蛋白保守结构域分析; B: PIF3/PIF4/PIF5氨基酸序列比对; C: PIF3/PIF4/PIF5蛋白的分子进化树; D: 4个物种之间PIF3/PIF4/PIF5蛋白的进化距离 Figure 4 Conservation domain analysis,protein sequence alignment ,Molecular evolution tree and evlutional distance of PIF3/PIF4/PIF5 proteins Note: A: Conservation domain analysis of PIF3/PIF4/PIF5 protein; B: PIF3/PIF4/PIF5 protein sequences alignment; C: Molecular evolution tree of PIF3/PIF4/PIF5 proteins; D: The distance of PIF3/PIF4/PIF5protein bewteen four species |
PIF3在大豆中有4个直系同源候选基因,其中GmPIF3a和GmPIF3b均是全长,并且基因编码序列全长都有PUT序列覆盖。而GmPIF3c和GmPIF3d均不是全长,而且没有EST表达数据,表明这2个基因有可能在长期的进化的过程已经沦为没有功能的假基因。
PIF4在蒺藜苜蓿中没有找到直系同源候选基因,在百脉根中有一个直系同源候选基因片段,但是没有EST表达数据。
PIF4在大豆中有3个直系同源候选基因。并且GmPIF4a和GmPIF4b的基因全长都有PUT序列覆盖,GmPIF4c也有EST部分表达数据。
PIF5在豆科的3个物种中均没有找到直系同源候选基因,可能表明PIF5的直系同源基因在豆科的长期进化过程中丢失了。
PIF3在豆科中的进化历史比较复杂,MtPIF3a与其他PIF3/PIF4/PIF5的亲缘关系较远,与PIF3的相似性只有16.1%,而MtPIF3b和LjPIF3b也位于PIF3的外层,MtPIF3a可能是蒺藜苜蓿中PIF家族的另外一个基因。在长期的进化过程中,MtPIF3a在拟南芥中的直系同源基因已经丢失。当然也有可能是另一种可能性,这将会在下面分析到。PIF3在以拟南芥为代表的十字花科和豆科中的进化历史可能如下:在十字花科和豆科分离之前,PIF3基因就发生一次复制事件,复制为PIF3A和PIF3B。十字花科和豆科分离之后,PIF3B在拟南芥中丢失,而在豆科3个物种蒺藜苜蓿,百脉根和大豆中得以保存,分别是MtPIF3b,LjPIF3b,GmPIF3c和GmPIF3d。PIF3A在蒺藜苜蓿中为MtPIF3a,可能由于某种机制,发生了功能较大的分化,其相应的功能由MtPIF3b替代。而PIF3A在大豆中发生1次复制,复制为GmPIF3a和GmPIF3b。
PIF4的进化历史比较简单,其在蒺藜苜蓿中已经丢失,而在百脉根中也可能已经退化。而在大豆中则经历了2次复制事件,并且丢失了1个基因拷贝。
总之,在豆科的长期进化过程中,拟南芥中的PIF5在豆科的3个物种中均找不到直系同源基因,而PIF3和PIF4中的直系同源基因已经在蒺藜苜蓿中丢失或者演化为其它功能的基因。而在大豆中均有相应功能的基因存在;PIF3和PIF4在百脉根中的情形则介于蒺藜苜蓿和大豆之间。
1.5 SRR1在豆科中直系同源候选基因的鉴定
SRR1(sensitivity to red light reduced 1)的在生物钟的功能和PIF3类似,都与PHYB介导的光信号传导有关,是生物钟中央振荡器产生正常节律所必需的调控因子。光信号途径和生物钟的之间的联系最初也在SRR1(sensitivity to red light reduced 1)基因中找到了证据,SRR1突变株系中在PHYB介导的信号途径和普通的生物钟信号输出途径中存在着某种缺陷,表明SRR1基因是正常的生物钟震荡功能所必须的。分子遗传学上的研究ssr1突变株系在光照条件一致的情况下,会改变很多生物钟输出的成分。
SRR1基因在蒺藜苜蓿中没有找到直系同源候选基因,在百脉根有2个直系同源基因,其中LjSRR1a为全长,并且全长有PUT序列覆盖,而但是LjSRR1b不是全长(表5)。
表 5 SSR1在豆科2个物种中的直系同源候选基因 Table 5 The forecast Orthologs genes of SSR1 in two species of Legume |
SRR1在大豆也有2个直系同源基因,相似性在53%以上,并且全长都有PUT序列覆盖。 GmSRR1a和GmSRR1b的进化距离只有0.008,表明这2个基因是在大豆属与苜蓿属种分离后,最近一次复制事件的(图5)。
图 5 SSR1蛋白的保守功能结构域分析, 氨基酸序列比对, 分子进化树和进化距离 注: A: SSR1蛋白保守结构域分析; B: SSR1氨基酸序列比对; C: SSR1蛋白的分子进化树; D: 4个物种之间SSR1蛋白的进化距离 Figure 5 Conservation domain analysis,protein sequence alignment ,Molecular evolution tree and evlutional distance of SSR1 proteins Note: A: Conservation domain analysis of SSR1 protein; B: SSR1 protein sequences alignment; C: Molecular evolution tree of SSR1 proteins; D: The distance of SSR1 protein bewteen four species |
1.6 CO/COL1/COL2在豆科中直系同源候选基因的鉴定
CO基因编码一个核蛋白,这个蛋白包含了一个在TOC1蛋白和CO-like蛋白中都具有的CCT结构域,还包含了2个B-box型的锌指区域,这2个区域可能接到了蛋白质之间的相互作用。在长日照条件下,CO基因的表达在白天的最后时期以及夜晚时达到最大。但是在短日照条件下,它的表达模式就发生了改变,大部分的表达都发生在夜晚。CO的这种与光周期相一致的表达被认为在长日照条件下诱导开花的生理过程中发挥了重要的作用。CO的这种表达机制似乎与它在控制FT(FLOWERING LOCUS T)的活性有关。FT是一个及其重要的催化开花的基因,并且它的表达与CO的活性有着紧密的联系。在toc1-1突变株系中,CO的表达模式发生了改变,无论是在长日照还是在短日照条件下,这种改变导致了对光周期不敏感的早花现象。
在拟南芥中,CO与COL2的亲缘关系比CO与COL1的亲缘关系更近一些。拟南芥是长日照植物,而百脉根,大豆,蒺藜苜蓿都是短日照植物,而CO则是拟南芥由生物钟调控的光周期控制开花的生理途径中一个非常重要的基因,CO和COL1在蒺藜苜蓿,百脉根,大豆,中都找不到直系同源基因,也说明了CO基因是控制拟南芥在短日照条件下开花的一个关键性的基因。
在蒺藜苜蓿中没有找到COL1,COL2的直系同源基因,与相似性最高的基因为AC127169_10,在拟南芥中对应的是CONSTANS-like B-box zinc finger protein(表6)。
表 6 CO/COL1/COL2在豆科2个物种中的直系同源候选基因 Table 6 The forecast Orthologs genes of CO/COL1/COL2 in two species of Legume |
在百脉根中,COL2只有1个直系同源候选基因片段,相似性为50.1%,有EST证据。
在大豆中,COL2有4个直系同源候选基因,相似性在50%以上。其中GmCOL2a和GmCOL2b有全长或接近全长的PUT序列的支持。
从氨基酸需类比对图中可以看出,CO,COL1和COL2基因在N端和C端分别有1段比较保守的区域,而从PUT证据来看,GmCOL2a和GmCOL2b有可能在大豆中有表达的。而GmCOL2c和GmCOL2d在大都中还没有找到表达的数据(图6)。
图 6 CO/COL1/COL2蛋白的保守功能结构域分析, 氨基酸序列比对, 分子进化树和进化距离 注: A: CO/COL1/COL2蛋白保守结构域分析; B: CO/COL1/COL2氨基酸序列比对; C: CO/COL1/COL2蛋白的分子进化树; D: 4个物种之间CO/COL1/COL2蛋白的进化距离 Figure 6 Conservation domain analysis,protein sequence alignment ,Molecular evolution tree and evlutional distance of CO/COL1/COL2 proteins Note: A: Conservation domain analysis of CO/COL1/COL2 protein; B: CO/COL1/COL2 protein sequences alignment; C: Molecular evolution tree of CO/COL1/COL2 proteins; D: The distance of CO/COL1/COL2 protein bewteen four species |
1.7 TIC在豆科中直系同源候选基因的鉴定
TIC(timeforcoffee),主要是抑制光敏色素介导的光信号输入进植物的生物钟系统,与ELF3的功能类似,充当生物钟的阀门的效应,使中央振荡器的节律性不被外界的高强度光所干扰。TIC的在下游的调控目标主要是LHY。
进一步的研究表明,在tic突变株系中,一些受到生物钟控制的性状表现为无节律性,表明其在生物钟生理途径中具有一定的功能。与ELF3在夜晚的功能相似,TIC在白天具有控制生物钟某个开光的功能。对tic/elf3双突变株系的完全无节律性性状表明,这两个基因在生物钟生理途径中具有重要的功能。光信号途径和生物钟的之间的联系最初也在SRR1(sensitivity to red light reduced 1)基因中找到了证据,SRR1突变株系中在PHYB介导的信号途径和普通的生物钟信号输出途径中存在着某种缺陷(Staiger et al., 2003),表明SRR1基因是正常的生物钟震荡功能所必须的。
TIC基因在蒺藜苜蓿中有一个直系同源候选基因,其相似性为40.4%,有EST证据(表7)。
表 7 TIC在豆科3个物种中的直系同源候选基因 Table 7 The forecast Orthologs genes of TIC in three species of Legume |
TIC基因在百脉根中有4个直系同源候选基因,但是都不是全长。其中LjTIC1和LjTIC2有EST数据支持。而LjTIC1和LjTIC4在CM0357的位置比较邻近,因此我们推测LjTIC1和LjTIC4就是百脉根中一个TIC基因由于基因组信息不全而被注释成了2个基因片段(表7)。
TIC基因在大豆中有4个直系同源候选基因,其中GmTIC1,GmTIC2,GmTIC3,是全长,并且有EST支持。而GmTIC4不是全长,并且没有EST支持(表7)。
LjTIC1虽然不是全长,但是其翻译的蛋白质序列最长的也含有1007个氨基酸。所以我们认为其大致可以代表其可能的全长基因序列来构建进化树和计算进化距离(图7)。
图 7 TIC蛋白的保守功能结构域分析, 氨基酸序列比对, 分子进化树和进化距离 注: A: TIC蛋白保守结构域分析; B: TIC氨基酸序列比对; C: TIC蛋白的分子进化树; D: 4个物种之间TIC蛋白的进化距离 Figure 7 Conservation domain analysis,protein sequence alignment ,Molecular evolution tree and evlutional distance of TIC proteins Note: A: Conservation domain analysis of TIC protein; B: TIC protein sequences alignment; C: Molecular evolution tree of TIC proteins; D: The distance of TIC protein bewteen four species |
从氨基酸需类比对图中可以明显看出,物种间序列的变异很多有相当一部分发生在谷氨酰胺重复的区域,尤其是LjTIC蛋白序列在保守区域比其他物种的TIC蛋白质序列多了4个重复的“QQQQH”序列,而在其周围也有谷氨酰胺的多个重复序列。
1.8 XCT在豆科中直系同源候选基因的鉴定
Martin(2008)在拟南芥中鉴定了XCT(XAP5 CIRCADIAN TIMEKEEPER)基因,该基因在应对光照调节生物钟和光形态发生生理过程中有着重要的作用。XCT对植物固有的生物钟功能有着重要的作用。XCT突变株系在各种条件下,都表现为振荡周期缩短。更有趣的是,当光的特性和波长不同的,XCT应对光的作用是不同甚至是相反的。XCT突变株系对红光特别敏感,但是对蓝光的反应却是正常的。与之相反,XCT突变株系对胚轴延伸的抑制作用对蓝光敏感,对红光却不敏感。XCT可能在总体上协调植物应对光照来协调植物生长发育的各种生理活动,XCT包含一个XAP保守结构域,这个结构域在高等真核生物钟很保守,表明它在高等真核生物的功能是非常重要的。
XCT基因在拟南芥和豆科的蒺藜苜蓿,百脉根,大豆中的相似性非常高,表明该基因对植物维持基本功能有着非常重要的作用,可能不仅仅限于生物钟调控途径(表8)。如图8所示,XCT有一个非常保守的XAP5结构域。而同时,我们也从图8看到,GmXCT1在保守区缺失了很大一部分序列。
表 8 XCT在豆科3个物种中的直系同源候选基因 Table 8 The forecast Orthologs genes of XCT in three species of Legume |
图 8 XCT蛋白的保守功能结构域分析, 氨基酸序列比对, 分子进化树和进化距离 注: A: XCT蛋白保守结构域分析; B: XCT氨基酸序列比对; C: XCT蛋白的分子进化树; D: 4个物种之间XCT蛋白的进化距离 Figure 8 Conservation domain analysis,protein sequence alignment ,Molecular evolution tree and evlutional distance of XCT proteins Note: A: Conservation domain analysis of XCT protein; B: XCT protein sequences alignment; C: Molecular evolution tree of XCT proteins; D: The distance of XCT protein bewteen four species |
1.9 FHY3在豆科中直系同源候选基因的鉴定
FHY3(far-red elongated hypocoty l3)是PHYA光信号传导途径中的一员。FHY3和FAR1是一对同源蛋白,它们都有一个明显的与突变了的转录子同源的序列。它们作为一种新发现的转录因子,对激活FHY1和FHL的表达起着关键性的作用。而FHY1和FHL的表达对光诱导下PHYA在核中的积累以及随后的光信号传导是必需的。
FHY3有3个明显的结构域,两端都是保守的锌指结构域,其中N端的是C2H2型锌指结构域,属于FAR1亚家族结构域,对结合DNA以及介导光信号的传道有着重要的作用,而中间的核心转录区域属于MULE亚家族,它和C端的SWIM型锌指结构域一起在转录水平上调控FHY3的活性,并且可以与自身形成同源二聚体或者与FAR1形成异源二聚体。并且,这种形成同源和异源二聚体的能力与FHY3的活性相关(Rongcheng et al., 2008) (图9)。
图 9 FHY3蛋白的保守功能结构域分析和氨基酸序列比对 注: A: FHY3蛋白保守结构域分析; B: FHY3氨基酸序列比对 Figure 9 Conservation domain analysis,protein sequence alignment of FHY3 proteins Note: A: Conservation domain analysis of FHY3 protein; B: FHY3 protein sequences alignment |
在红光条件下,对2个不同的FHY3等位基因株系对胚轴延伸的抑制作用明显加强,并且胚轴延伸的生物钟节律性被打断。FHY3对接收红光来进行生物钟的重新设定有着非常的作用,尤其是在在一天的早期阶段维持生物钟节律性(Allen et al., 2006)。
FHY3在蒺藜苜蓿和百脉根中均没有找到直系同源基因,在大豆中有2个直系同源候选基因,这2个基因之间的相似性为97.3%,与FHY3的相似性都为63.9%。表明GmFHY3a和GmFHY3b是最近发生的一次基因复制事件而产生的2个同源基因(表9)。其中GmFHY3a在体内全长表达,而GmFHY3b只有部分表达的PUT数据。
表 9 LHY在豆科3个物种中的直系同源候选基因 Table 9 The forecast Orthologs genes of LHY in three species of Legume |
2讨论
本部分采用生物信息学的方法对豆科中的光周期生物钟调控网络进行了分析。我们一共鉴定了41个大豆的生物钟相关候选基因,22个百脉根的生物钟相关候选基因,13个蒺藜苜蓿的生物钟相关候选基因。我们根据鉴定的直系同源基因的候选基因构建了9个分子进化树,并结合功能结构域和多序列联配的结果,对这些基因的功能,进化趋势进行了分析。我们的分析表明,生物钟调控途径在拟南芥和豆科的这3个物种中发生了不同程度的分化。而以拟南芥为参照,百脉根和蒺藜苜蓿的光周期生物钟调控网络相关基因的分化程度要大于大豆,这可能是由于百脉根和蒺藜苜蓿由于其基因组远小于大豆。
从进化的角度来看,不同物种间直系同源基因的功能都是从相同祖先基因分化而来,一般来说它们功能最为接近,我们通过同源基因所鉴定的候选基因是在目前没有实验数据支持的情况下能推知的与拟南芥相关基因功能最为类似的基因。与传统的分子生物的方法相比,生物信息学更为便捷,更具有目的性,而且可以在全基因的水平上进行分析,所得出的结论也更加全面,对我们的研究可对以后研究豆科的生物钟调控网络在实验阶段时的研究有一定的参考价值。
3材料与方法
3.1基因组数据来源与获得
蒺藜苜蓿,百脉根和大豆的原始数据的获得和分析以在线为主。表10中列出了4个物种进行在线生物信息学分析的基因组数据库及相应网站。
表 10 4个物种进行生物信息学分析相应的数据库和网址 Table 10 The Name and Website of the Databank of four species |
3.2直系同源基因的鉴定
用拟南芥中的相关基因的氨基酸序列在豆科这3个物种各自的基因组数据库上进行Blastp或者tBlastn,选取得分在100以上,E值在-30以下的序列为候选序列,将比对结果中相似性最高的序列在NCBI中反向Blastp拟南芥的蛋白质库以确定是否是直系同源基因,如果不是,则表明该基因在该物种没有直系同源基因,如果是,则以该序列为标准,进一步确定其它直系同源基因。
3.3保守结构功能域的分析
综合利用NCBI上的CDD (Marchler-Bauer, 2007) (Conserved Domain Search)对目标序列进行保守结构域的分析。
3.4多序列联配,系统进化树构建和进化分析
利用ClustalX程序,对4个物种中的直系同源候选基因进行氨基酸序列比对,采用默认参数。用MEGA4软件的NJ方法构建系统进化树的构建,自展开1000次,计算进化距离。同时,根据构建的进化树,我们可以大致推算某个基因在豆科和十字花科之间的进化历史。
3.5表达数据的获得和分析
PlantGDB的PUT序列是经过聚类去除冗余并部分拼接为全长cDNA的高质量的EST序列。将直系同源候选基因的核苷酸序列BLASTN比对PUT序列,如果匹配上的PUT序列相似性大于95%,碱基长度长于200bp,E值小于1E-30,我们则认为该PUT能够证明其匹配的直系同源候选基因部分是真实表达的。我们将EST证据分为3类:F,E,N。F代表整个候选基因有PUT序列覆盖,或者两端有PUT序列覆盖并且整个基因80%的序列被PUT序列覆盖。N表示该基因找不到符合要求的配比PUT序列,E则表示该基因的某个部分或者几个部分有符合要求的PUT序列覆盖,但是还没有达到F的标准。
3.6基因的重新注释
在鉴定豆科中3个物种同源候选基因时,由于基因组信息不全或者注释的错误,会出现没有全长ORF的基因,我们将该部分ORF的基因所对应的基因组区域序列在GenScan上重新注释,得到的全长ORF的基因,并将得到的ORF序列重新Blast比对物种相应的PlantGDB的基因组序列以确认其是否对应着原始的基因组区域,同时将ORF序列翻译的氨基酸序列反向Blastp拟南芥的蛋白质数据库以确认其是否是相关的直系同源基因。
作者贡献
李宗飞是本实验的执行人,负责实验设计、实施、数据分析及论文初稿写作;刘振鹏、魏芳参与数据分析、初稿的形成、修改;方宣钧确定研究项目的构思、指导论文的写作及修改。全体作者阅读并同意最终的文本。
致谢
本研究由海南省热带农业资源开发利用研究所开放研究基金项目资助。
参考文献